Lịch sử Trí tuệ nhân tạo tạo sinh

Kể từ khi thành lập, lĩnh vực học máy (machine learning) đã sử dụng các mô hình thống kê, bao gồm cả mô hình tạo sinh, để mô hình hóa và dự đoán dữ liệu. Bắt đầu từ cuối những năm 2000, sự xuất hiện của học sâu (deep learning) đã thúc đẩy tiến bộ và nghiên cứu trong xử lý ảnh và video, phân tích văn bản, nhận dạng giọng nói và các tác vụ khác. Tuy nhiên, hầu hết các mạng thần kinh sâu được đào tạo như các mô hình phân biệt thực hiện các tác vụ phân loại như phân loại hình ảnh dựa trên mạng thần kinh tích chập.

Năm 2014, những tiến bộ như autoencoder biến đổi (VAE) và mạng đối nghịch tạo sinh đã tạo ra các mạng thần kinh sâu thực tế đầu tiên có khả năng học các mô hình tạo sinh, thay vì phân biệt, của dữ liệu phức tạp như hình ảnh. Các mô hình tạo sinh sâu này là những mô hình đầu tiên có thể xuất ra không chỉ tạo nhãn (label) cho hình ảnh, mà còn có thể xuất ra toàn bộ hình ảnh.[14]

Năm 2017, mạng Transformer đã cho phép phát triển các mô hình tạo sinh, dẫn đến Generative pre-trained transformer (GPT) đầu tiên vào năm 2018.[15] Tiếp theo là GPT-2 vào năm 2019, đã chứng minh khả năng tạo sinh không giám sát cho nhiều tác vụ khác nhau như một mô hình nền tảng (Foundation model).[16]

Năm 2021, sự ra mắt của DALL-E, một mô hình tạo sinh pixel dựa trên transformer, tiếp theo là MidjourneyStable Diffusion đã đánh dấu sự xuất hiện của nghệ thuật trí tuệ nhân tạo chất lượng cao thực tế từ các lời nhắc hoặc gợi ý (prompt).

Vào tháng 1 năm 2023, Futurism.com đã đưa tin rằng CNET đã sử dụng một công cụ AI nội bộ không được tiết lộ để viết ít nhất 77 câu chuyện của mình; sau khi tin tức được công bố, CNET đã đăng các bản sửa lỗi cho 41 câu chuyện.[17]

Vào tháng 3 năm 2023, GPT-4 đã được phát hành. Một nhóm từ Microsoft Research lập luận rằng "nó có thể được xem một cách hợp lý như một phiên bản ban đầu (nhưng vẫn chưa hoàn chỉnh) của hệ thống trí tuệ tổng quát nhân tạo (AGI)".[18]

Tài liệu tham khảo

WikiPedia: Trí tuệ nhân tạo tạo sinh https://www.nytimes.com/2023/01/27/technology/anth... https://news.bloomberglaw.com/tech-and-telecom-law... https://www.nytimes.com/article/ai-artificial-inte... https://www.worldcat.org/issn/0362-4331 https://openai.com/research/generative-models http://www.arxiv.org/abs/2201.08239 https://www.economist.com/business/2023/03/06/dont... https://www.mckinsey.com/industries/retail/our-ins... https://hbr.org/2023/07/how-generative-ai-can-augm... https://www.worldcat.org/issn/0017-8012